动态治疗方案(DTR)的最新进展有助于寻找最佳治疗方法,这些治疗是针对个人的特定需求量身定制的,并能够最大程度地提高其预期的临床益处。然而,依靠一致轨迹(例如逆概率加权估计器(IPWE))的现有算法可能会遭受最佳治疗和越来越多的决策阶段的样本量不足,尤其是在慢性疾病的情况下。为了应对这些挑战,我们提出了一种新型的个性化学习方法,该方法估算了DTR,重点是优先考虑观察到的治疗轨迹与在决策阶段最佳制度获得的轨迹之间的一致性。通过放松限制,即观察到的轨迹必须与最佳治疗方法完全排列,我们的方法基本上提高了基于IPWE的方法的样本效率和稳定性。尤其是拟议的学习计划建立了一个更一般的框架,其中包括流行的成果加权学习框架作为我们的特殊情况。此外,我们介绍了阶段重要性得分的概念以及注意机制,以明确说明决策阶段之间的异质性。我们建立了所提出方法的理论特性,包括Fisher的一致性和有限样本的性能结合。从经验上讲,我们在广泛的模拟环境中评估了所提出的方法,并针对COVID-19大流行进行了实际案例研究。
主要关键词